为什么最好的老师不安排考试

原文:Why the Best Teachers Don't Give Tests (##) - Alfie Kohn

作者:Alfie Kohn

坦白说,许多教育工作者自相矛盾的态度令我不解。一方面,他们强烈反对标准化考试;另一方面,他们却对与考试如出一辙的做法听之任之。

首先,请看那些与考试挂钩课程标准——巨细靡遗、事无巨细地规定教学内容的条目清单。这些标准无一例外地体现了标准化考试的特点:自上而下的控制,「一刀切」的做法。然而,从「问责制」教育改革伊始,到如今盖茨基金会力推覆盖全美的共同核心标准,许多人对统一的课程标准(乃至将教育标准化的整个理念)不置一词,却对推行这些标准的考试皱起眉头。[1]

第二个例子:精心设计、用以评判学生成绩的评分标准是另一种形式的标准化评估,但它很少被认为是标准化评估。这种方法旨在将写作等复杂事物分解成各个部分,以便老师,有时还有学生本人,能够对每个部分进行评分。其合理性的前提是不管谁来评分,面对同一份卷子,都得出相同的分数。评分标准的诞生源于量化的要求和简化的冲动,Maja Wilson 认为,量化和简化带来的后果之一是「评分标准的标准化导致了学生的模板化」。[2]然而,令人惊讶的是,许多对标准化考试深恶痛绝的老师,却对这种悄然而至的标准化熟视无睹。一些人坚称,只要使用一个优质的评分标准,就不存在问题,尽管大量事实证明并非如此。

不过,我最想说的是第三个例子:当老师对学生进行测试(test)时,每个班级的测试细节都不尽相同,这意味着这些评估从根本上讲就不是标准化的,不能用来比较不同学校或不同州的学生。但它们依然是测试,因此不可避免地有局限性,并同时局限了学生。

就像面对评分标准(和分数)一样,许多人的第一反应就是,我们只需要更好的考试,或者只需要修改实施考试的方式(例如,允许学生重考)。不可否认,有些考试确实比其他考试更烂。多选题测试作为评估方式存在独特的缺陷,其原因与多选题标准化测试如出一辙: 试题刻意设置陷阱,引诱理解相关概念的学生选错答案,同时也剥夺了学生自主作答乃至解释答案的机会。尽管多选题考试可以灵活命题,但正如印第安纳大学的考试设计专家 Roger Farr 最终得出的结论一样,「任何多选题都无法让学生展示他们能用所学知识做些什么」。

我们也不得不承认,在给学生考试的种种缘由中,有些理由比其他理由更值得商榷。利用考试来发现哪些学生需要帮助——或者,让一些思虑更周全的老师审视自己教学中可能存在的问题,与利用考试来要求学生集中注意力、完成作业,这两者之间是有区别的。在后一种情况下,考试被用作迫使学生去做他们不感兴趣的事情的手段。对于一些老师而言,与其解决教学内容或方式中可能存在的缺陷(比如在决定学习内容时忽视了学生的参与),不如只提醒学生考试即将来临——甚至为了更明目张胆地行使权力,搞突击测试——就能让学生乖乖听话。

不管考试是如何设计的,或者出题人的动机如何,有一点是明确的:这些评估工具往往更侧重于衡量塞入学生短期记忆的零散知识点的数量,而非评估他们对知识的真正理解。[3] 考试,包括那些涉及论文的考试,都是传统教学模式的一部分。在这种教学模式中,知识(通过讲课和教科书)传递给学生,以便学生日后根据指令再吐出来反刍。让人感到不解的是,一些老师声称自己采用以学生为中心的教学法,提倡积极、互动的学习方式,但在评估学生时,却仍然高度依赖考试这一单一手段。(有些人甚至混淆了「评估」和「考试」的概念,在他们看来,评估就等同于考试,没有其他可能性。)

虽然有些试题可能需要学生运用解决问题的技能,但考试本身只是一种脱离实际的纸笔测验,只能衡量学生记忆了多少知识,以及他们应试的技能有多高。正因如此,一个头脑灵活的学生可能会在考试中得分很低。当考试由 Pearson 或 ETS 这样的机构命题时,大多数老师可以毫不犹豫地指出班上有哪几个学生符合这种情况。然而,他们可能没有意识到,同样的问题也存在于他们自己出题的考试中。

然而,考试不仅只评估最无关紧要的智力能力,还可能扭曲学生的学习目标和方式。你越是把注意力集中在为了应付考试必须掌握的知识上,你就越难以沉浸于故事情节之中,或者全身心地投入项目设计和实验探索之中。而且,如果考试过于频繁,哪怕只是常常提及,都足以窒碍学生的求知热情。应试学习与纯粹为了求知而学习有着本质的区别。[4]


多年前,芝加哥大学的著名教育家 Philip Jackson 采访了 50 名公认杰出的老师。他发现,这些老师普遍不重视考试,有些甚至有意识地尽量减少考试。[5] 我认为,这主要有两个原因。首先,优秀的教育工作者深知考试并非特别有效的评估方式。其次,这些老师在教学生涯中都意识到,他们不需要考试。设计精妙的课堂和课程能帮助老师全面深入地了解学生对知识的领悟。当学生投入到富有意义的主动学习中时(例如开展长时间跨学科的项目),老师通过观察和倾听学生在计划与实施项目过程中的表现,可以持续获得并积极解读源源不断的信息,了解每个学生能够做什么,在哪些方面需要帮助。在学习过程结束后,再给学生额外安排一场考试就显得有些多余了。我们甚至可以断言,老师越倾向于用考试来衡量学生的进步,就越能说明教学中存在某些问题——可能是老师对学生的非正式观察和了解还不够深入,可能是教学任务设计的质量有待提高,也可能是整个学习模式有待改进。例如,如果老师偏爱直接教学法,那么他们可能很难真正洞察学生内心的想法。这自然会导致他们得出结论,认为「有必要」通过考试来评估学生表现。[6]

Assessment (评估)一词的字面意思是「坐在一旁」,这正是我们最富有洞见的教育者所提倡的做法。Yetta Goodman 创造了「kidwatching」这个复合词,用来表示与每个孩子一起阅读,以评估他或她的能力。Marilyn Burns 坚信,与学生面对面交流,比起考试更能帮助我们深入了解他们对数学的理解程度——因为误解的原因是千奇百怪的。当然,这里的前提是我们真正关注的是孩子对知识的理解能力,而不仅仅是他们的语音意识水平或应用算法的能力。一个人的教育目标越没志气,就越有可能满足于仅靠考试来评估学生——同样,也就越倾向于将 testing(考试)」和 assessing(评估)这两个词混为一谈。

可靠的评估形式比比皆是:作品集(portfolios)、毕业设计(culminating projects)、表现评估(performance assessments),以及已故的 Ted Sizer 提出的「精通的展示(exhibitions of mastery)」:让学生有机会展示他们的精通程度,并非按要求回忆事实,而是通过实际行动:设计并进行一个实验(并解释实验结果),用外语制作一份餐厅菜单,把一个故事改编成短剧。换句话说,如果想在学习后而非学习中进行评估,考试仍然不是必需品,也不见得特别有用。考试不必用于「终结性」评估,更不必用于 「形成性」评估。

我们中的许多人反对标准化测试,不仅出于考试的有害用途,还因为考试是强加于人的。更令人不安的是,我们自己出的考试也可能造成伤害。幸好,我们有比考试好得多的选择。


附注

  1. 请参阅我 2001 年 9 月 26 日发表在《教育周刊》上的文章《标准化考试的「标准」同样值得警惕》。在加拿大,这种现象尤为普遍。加拿大的教育体系是完全分权的,每个省都控制着自己的政策。尽管各省之间的考试数量有很大差异,但所有省份都有非常具体的分年级课程,每位老师必须照此执行。即使在一些公开反对考试的省份,人们也鲜有对这种高度控制和老师自主权被削弱提出异议。

  2. Maja Wilson, Rethinking Rubrics in Writing Assessment (Heinemann, 2006), p. 39.

  3. 近来,一系列引起大众媒体高度关注的研究表明,频繁测试(包括自测)比其他学习形式更为有效。但这些研究的评估标准几乎都局限于在后续测试中能正确回忆事实的数量。这些实验非但没有为传统评估提供有力证据,实际上还揭示了研究人员和记者常用的「学习」和「成绩」等词汇,往往只意味着成功地、大概也是暂时地记住事实的过程。这篇文章深入剖析了其中一项研究。

  4. 最近,我在 Twitter 上指出,对考试的预期会分散学生的注意力,使他们无法专注于思考。结果这条推文被转发 400 多次。如此高的转发量令我怀疑自己的观点是否被误解了。我随后澄清,所有测试都会产生这种影响,而非仅限于标准化测试。转发量随即下降了 90%。

  5. Philip W. Jackson, Life in Classrooms (Teachers College Press, 1968/1990).

  6. Frank Smith 曾写道:「如果一名老师不通过考试就无法判断学生是否真的学到了东西,那他就不该继续在课堂上任教。」我明白他想表达的意思,但觉得说得有点苛刻。老师需要相应的帮助,以学会在不借助考试的情况下评估学生。他们需要得到支持和鼓励,才能摒弃那些多数同行仍在使用、管理者、家长和学生自己也普遍期待的做法。何况,在评估学生的学习成效时,障碍往往不在老师个人,而在于学校的结构性问题,比如班级人数过多、课时太短等。对此,我们应该群策群力,致力于改变这些有问题的政策,而非继续依赖考试。